% !Mode:: "TeX:UTF-8" 

\BiAppendixChapter{结\quad 论}{Conclusions}

本学位论文结合国防科技创新特区H863计划重点项目项目，因应多智能体系统在更为广泛和复杂的任务场景中的应用需求，本文针对复杂拒止环境中多智能体系统的构型控制和规划方法进行了深入研究。论文的主要研究成果总结如下：

(1) 针对二阶多智能体系统，将多维空间的包围构型控制问题分解为多个一维空间的包围控制问题。首先，设计了基于状态反馈和速度反馈的分布式一致性加速度控制律，利用李雅普诺夫稳定理论验证了控制律的稳定性。然后，设计了基于邻接节点相对测量的自适应估计算法，实现了分布式估计跟随者节与领导者集群平均位置之间相对距离的功能。结合加速度控制律，提出了基于相对测量的包围构型控制方法，解决了多智能体系统在导航拒止条限制的包围构型控制问题。

(2) 针对导航拒止环境下的移动定位系统，建立了面向PDOP定位构型的构型控制问题，发展了通用PDOP覆盖构型指标，解决了PDOP在奇异构型下分布不连续的问题。推导得到了覆盖指标对每一个多智能体节点位置状态偏导数的解析表达式，包括指标在覆盖区域的偏导数和在覆盖边缘上的偏导数公式。设计了基于梯度下降法的分布式构型控制方法，实现了通过构型控制实时、定量地优化协同定位过程的目的。

(3) 针对多智能体节点状态存在不确定性的构型规划问题，使用参数化高斯信念空间，建立了基于连续信念空间的构型规划框架，将节点状态不确定性作为规划指标，提升了规划方法对环境中随机扰动的鲁棒性。在规划框架中，提出了基于数值差分的目标函数梯度计算方法，并以此为基础设计了基于梯度下降更新的待评估路径生成方法。该方法不需要将运动空间离散化，因此具有多项式计算复杂度。

(4) 在前一种构型规划方法的基础上，针对观测通信设备存在物理测量边界的问题，设计了基于概率拓扑的构型规划方法。该方法以未来拓扑概率为权值，对所有拓扑分支下目标函数的可能取值取期望，作为对给定候选路径的评估指标。针对一类圆盘观测模型，建立了观测连通变量的精确数学模型，设计了该变量概率分布的自适应精确计算算法，推导了该算法稳定的充分条件。该方法发展了测量拓扑在未来规划期限内随机分布的观点，突破了传统规划方法使用确定性未来测量拓扑的框架。


%针对包围构型控制过程，智能体在拒止环境下无法获得在绝对坐状态观测的问题，研究如何仅使用局部坐标系下相对观测数据实现包围构型的分布式控制方法。对二阶积分器的跟随者多智能体系统，首先假设智能体节点在绝对坐标系下的状态是已知的，设计了包围构型的分布式协同控制律，使用李亚普诺夫稳定理论，验证了控制律对领导者平均位置已知和平均位置未知两种情况的稳定性；然后在拒止环境下，当跟随者多智能体系统仅能获得相对观测时，设计了仅使用相对观测数据实现包围构型的分布式协同控制律；二维平面的包围构型的数值仿真实验结果表明，本文所设计的控制律是分布式的，且可以仅依赖局部坐标系下的相对观测数据实现包围构型。

%(2) 为了探究构型控制与协同定位的耦合关系，研究了移动协同定位服务系统中的PDOP构型控制方法。在假设所有多智能体系统的位置状态已知的前提下，使用多智能体系统和相对测量为大范围拒止环境中的其他节点提供优化的定位服务，基于覆盖控制框架和梯度下降策略，设计了面向用户PDOP构型的分布式控制方法。通过严格的理论推导得出了PDOP场覆盖指标对每一个节点位置的导数表达式，提出了以覆盖指标梯度的单位向量为方向，固定更新步长的分布式PDOP构型控制方法。数值仿真结果验证了理论推导过程的正确性。仿真结果揭示了，可以通过主动的构型控制使协同定位一直保持最优的定位构型，从而提升定位性能。

%(3) 针对智能体状态存在不确定性的问题，研究了基于信念空间的多智能体系统构型规划方法。该方法采用模型预测框架，使用最大似然估计预测在给定控制下系统的行为表现从而计算对应的目标函数的取值，并通过数值梯度下降方法生成待评估控制，当评估的候选控制输入达到预设阈值、或梯度变化小于给定阈值时，选择最优目标函数值所对应的控制输入作为路径规划的结果。使用主动协同定位任务作为实验场景，通过与构型保持方法的仿真对比显示，本章提出的基于信念空间的构型规划方法可以提升任务执行的稳定性。

%(4) 针对测量传感器存在最大观测边界，且智能体状态存在不确定性的问题，研究了基于概率拓扑的构型规划方法。设计了规划期限内每一种观测拓扑出现概率的预测方法，并通过严格的理论推导证明了预测算法的稳定性，并给出了算法稳定的充分条件。基于拓扑概率预测算法，构型规划过程将评估规划期限内所有可能出现的拓扑分支，并且以预测的拓扑概率为权值，计算目标函数在所有拓扑分支上的期望值，以此作为给定控制输入的衡量标准。针对单智能体和多智能体系统的两个数值仿真实验验证了概率拓扑构型规划方法的可行性和有效性。

本学位论文的主要创新点总结如下：

(1) 提出了基于相对测量的包围构型分布式协同控制方法，仅使用局部坐标系下的相对测量，解决了导航拒止条件下的包围控制问题。分布式控制过程具有抗节点损毁能力和较低的算法复杂度。实现了对智能体节点加速度(受力)的直接控制，相较于传统针对一阶多智能体系统包围控制问题设计的速度控制器更具有优势。

(2) 设计了面向PDOP定位构型的分布式构型控制方法，解决了PDOP在奇异构型下分布不连续的问题，得出了覆盖指标对每一个智能体节点位置状态偏导数的解析表达式，实现了通过构型控制实时、定量地优化协同定位过程的目的，达到了利用节点机动性拓展了移动定位系统的覆盖范围，分布式控制架构提升了移动定位系统对节点初始位置、多智能体系统规模突变以及热点切换事件的适应性和鲁棒性。

(3) 提出类一种高斯参数化信念空间的构型规划框架，研究了基于数值差分的目标函数梯度计算方法，设计了连续信念空间中基于梯度下降的待评估路径生成方法，避免了传统的离散化路径生成方法计算复杂度指数增长的问题，提升了构型规划方法对拒止环境不确定性的鲁棒性。

(4) 提出了一种基于圆盘观测模型的构型规划方法，对圆盘观测模型的观测连通变量进行精准建模，推导出了概率计算过程中截断误差稳定的充分条件，解决了圆盘观测模型连通概率任意精度精确计算的问题。提出了基于概率拓扑的构型规划框架，突破了传统规划方法使用确定性未来测量拓扑的思维框架，提升了构型规划方法对系统未来行为预测准确性，以及对状态不确定性和时变随机拓扑的鲁棒性。仿真结果表明，基于精确概率拓扑的规划方法比基于伯努利确定性拓扑的规划方法在多项指标上提升超过$20\%$。

%(1) 本文所设计的包围构型控制方法的创新性表现在三个方面，首先该方法针对的是二阶积分器的多智能体系统；其次该方法是分布式的，仅使用自身和邻接节点的测量数据；最后该方法不需要依赖绝对坐标系下的状态信息。

%(2) 面向PDOP定位构型的协同控制方法实现了通过主动的构型控制实现优化的PDOP构型，从而提升定位性能的目的。由于该方法仅需要节点自身及其邻接节点的测量和通信数据，因此该方法是分布式的，不需要中心节点；支持在线部署，不需要离线设计节点的运动轨迹；适用于任意数量的多智能体系统。

%(3) 基于信念空间的构型规划方法属于连续空间的路径规划算法，相比于已有的RRT,PRM 离散化方法，具有较低的计算复杂度；另外该方法不需要使用经验执行从任务到期望构型的映射，而是计算构型变化对最终目标的影响。

%(4) 提出了圆盘观测模型连通概率的精确预测方法，通过严格的理论推导给出了预测误差稳定的充分条件；使用精确的拓扑概率评估目标函数在规划期限内的每一个拓扑分支上的取值，而不是只评估最大似然观测一个分支，从而可以更加准确地预测在给定控制输入下多智能体系统的未来状态。

综上所述，本学位论文对复杂拒止环境下多智能体系统的构型控制和构型规划方法进行了一些探索和研究。基于当前技术发展趋势，作者认为在该研究方向上仍存在如下问题需要进一步探讨：

(1) 包围构型控制方法中仅研究了对静态领导者的包围构型控制律设计，未来的研究可聚焦于对运动领导者的包围构型控制方法。

(2) 连通概率的计算方法仅适用于圆盘观测模型，且受限于计算平台的舍入误差影响，观测器最大观测半径的增加将使得概率预测精度变差。因此针对其他观测设备如何计算连通概率预测，以及如何优化圆盘模型概率预测的计算过程的问题仍然有待解决。

(3) 随着对多智能体系统研究的深入，大规模、超大规模的多智能体系统(集群系统)将是该领域的热门发展方向。然而在本学位论文关于构型规划的成果目前仍无法适用于大规模的多智能体系统。因此未来的工作将着重探索具有状态不确定性的分布式构型规划策略。


